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Description 

FIELD OF THE INVENTION 

[0001] The present invention relates to a client-server 
speech recognition system for recognizing speech input 
at a client by a server, a speech recognition server, a 
speech recognition client, their control method, and a 
computer readable memory. 

BACKGROUND OF THE INVENTION 

[0002] In recent years, speech is used as an input in- 
terface in addition to a keyboard, mouse, and the like. 
[0003] However, the recognition rate of speech recog- 
nition that recognizes input speech lowers and requires 
a longer processing time as the number of recognition 
words which are to undergo speech recognition becomes 
larger. For this reason, in an actual method, a plurality 
of recognition dictionaries or lexicons that register rec- 
ognition words (e.g., pronunciations and notations) which 
are to undergo speech recognition are prepared, and are 
selectively used (a plurality of recognition dictionaries 
may be used at the same time). 

[0004] Also, unregistered words cannot be recog- 
nized. As one of methods for solving this problem, a user 
dictionary or lexicon (prepared by the user to register 
recognition words which are to undergo speech recog- 
nition) may be used. 

[0005] On the other hand, a client-server speech rec- 
ognition system has been studied to implement speech 
recognition on a terminal with insufficient resources. 
[0006] These three techniques are known to those who 
are skilled in the art, but a system that combines these 
three techniques has not been realized yet. 
[0007] WO-A-99/26233 discloses a client-server 
speech recognition system in which speech data gener- 
ated by a client is transmitted to a speech recognition 
server where the speech is recognised and the recog- 
nised speech is returned to the client. 

SUMMARY OF THE INVENTION 

[0008] According to one aspect, the present invention 
provides a client-server speech recognition system for 
recognizing speech input at a client by a server, 
the client comprising: 

speech input means for inputting speech; 
user dictionary holding means for holding a user dic- 
tionary formed by registering target recognition 
words designated by the user; and 
transmission means for transmitting speech data in- 
put by said speech input means, dictionary manage- 
ment information used to determine a recognition 
field of a recognition dictionary used to recognize the 
speech data, and the user dictionary to the server, 
and 



the server comprising: 

recognition dictionary holding means for holding 
a plurality of kinds of recognition dictionaries 

5 prepared for respective recognition fields; 

determination means for determining one or 
more recognition dictionaries corresponding to 
the dictionary management information re- 
ceived from the client from the plurality of kinds 

10 of recognition dictionaries and the user diction- 

ary received from the client; and 
recognition means for recognizing the speech 
data using at least the recognition dictionary de- 
termined by said determination means. 

15 

[0009] Other features and advantages of the present 
invention will be apparent from the following description 
taken in conjunction with the accompanying drawings, in 
which like reference characters designate the same or 
20 similar parts throughout the figures thereof. 

BRIEF DESCRIPTION OF THE DRAWINGS 

[0010] 

25 

Fig. 1 is a block diagram showing the hardware ar- 
rangement of a speech recognition system of the 
first embodiment; 

Fig. 2 is a block diagram showing the functional ar- 
30 rangement of the speech recognition system of the 
first embodiment; 

Fig. 3 shows the configuration of a user dictionary 
of the first embodiment; 

Fig. 4 shows a speech input window of the first em- 
35 bodiment; 

Fig. 5 shows an identifier table of the first embodi- 
ment; 

Fig. 6 is a flow chart showing the process executed 
by the speech recognition system of the first embod- 
40 iment; 

Fig. 7 shows the configuration of a user dictionary 
appended with input form identifiers according to the 
third embodiment; and 

Fig. 8 shows the configuration of a user dictionary 
45 appended with recognition dictionary identifiers ac- 
cording to the third embodiment. 

DESCRIPTION OFTHE PREFERRED EMBODIMENTS 

50 [0011] Preferred embodiments of the present inven- 
tion will be described in detail below with reference to the 
accompanying drawings. 



[0012] Fig. 1 shows the hardware arrangement of a 
speech recognition system of the first embodiment. 
[0013] A CPU 101 systematically controls an entire cli- 



[First Embodiment] 
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ent 1 00. The CPU 1 01 loads programs stored in a ROM 
102 onto a RAM 103, and executes various processes 
on the basis of the loaded pro grams. The ROM 102 stores 
various programs of processes to be executed by the 
CPU 1 01. The RAM 1 03 provides a storage area required 
to execute various programs stored in the ROM 1 02. 
[001 4] A secondary storage device 1 04 stores an OS 
and various programs. When the client 1 00 is implement- 
ed using not a general-purpose apparatus such as a per- 
sonal computer orthe like but a dedicated apparatus, the 
ROM 102 may store the OS and various programs. By 
loading the stored programs onto the RAM 1 03, the CPU 
101 can execute processes. As the secondary storage 
device 104, a hard disk device, floppy disk drive, CD- 
ROM, or the like may be used. That is, storage media 
are not particularly limited. 

[001 5] A network l/F (interface) 1 05 is connected to a 
network l/F 205 of a server 200. 
[0016] An input device 106 comprises a mouse, key- 
board, microphone, and the like to allow input of various 
instructions to processes to be executed by the CPU 1 01 , 
andean be used by simultaneously connectingthese plu- 
rality of devices. An output device 107 comprises a dis- 
play (CRT, LCD, or the like), and displays information 
input by the input device 106, and display windows which 
are controlled by various processes executed by the CPU 
101. A bus 108 interconnects various building compo- 
nents of the client 100. 

[0017] A CPU 201 systematically controls the entire 
server 200. The CPU 201 loads programs stored in a 
ROM 202 onto a RAM 203, and executes various proc- 
esses on the basis of the loaded programs. The ROM 
202 sto res various p rograms of processes to be executed 
by the CPU 201 . The RAM 203 provides a storage area 
required to execute various programs stored in the ROM 
202. 

[001 8] A secondary storage device 204 stores an OS 
and various programs. When the server 200 is imple- 
mented using not a versatile apparatus such as a per- 
sonal computer orthe like but a dedicated apparatus, the 
ROM 202 may store the OS and various programs. By 
loading the stored programs onto the RAM 203, the CPU 
201 can execute processes. As the secondary storage 
device 204, a hard disk device, floppy disk drive, CD- 
ROM, or the like may be used. That is, storage media 
are not particularly limited. 

[001 9] The network l/F 205 is connected to the network 
l/F 105 of the client 100. A bus 206 interconnects various 
building components of the server 200. 
[0020] The functional arrangement of the speech rec- 
ognition system of the first embodiment will be described 
below using Fig. 2. 

[0021] Fig. 2 is a block diagram showing the functional 
arrangement of the speech recognition system of the first 
embodiment. 

[0022] In the client 100, a speech input module 121 
inputs speech uttered by the uservia a microphone (input 
device 106), and A/D-converts input speech data 



(speech recognition data) which is to undergo speech 
recognition. A communication module 122 sends a user 
dictionary 124a, speech recognition data 124b, diction- 
ary management information 124c, and the like to the 

5 server 200. Also, the communication module 122 re- 
ceives a speech recognition result of the sent speech 
recognition data 124b and the like from the server 200. 
[0023] A display module 1 23 displays the speech rec- 
ognition result received from the server 200 while storing 

10 it in, e.g., an input form which is displayed on the output 
device 1 07 by the process executed by the speech rec- 
ognition system of this embodiment. 
[0024] In the server 200, a communication module 221 
receives the user dictionary 124a, speech recognition 

15 data 124b, dictionary management information 124c, 
and the like from the client 1 00. Also, the communication 
module 221 sends the speech recognition result of the 
speech recognition data 124b and the like to the client 
100. 

20 [0025] A dictionary management module 223 switches 
and selects a plurality of kinds of recognition dictionaries 
225 (recognition dictionary 1 to recognition dictionary N, 
N: a positive integer) prepared for respective recognition 
fields (e.g., for names, addresses, alphanumeric sym- 

25 bols, and the like), and the user dictionary 1 24a received 
from the client 100 (may simultaneously use a plurality 
of kinds of dictionaries). 

[0026] Note that the plurality of kinds of recognition 
dictionaries 225 are prepared for each dictionary man- 
so agement information 1 24c (inputform identifier; to be de- 
scribed later) sent from the client 100. Each recognition 
dictionary 225 is appended with a recognition dictionary 
identifier indicating the recognition field of that recogni- 
tion dictionary. The dictionary management module 223 
35 manages an identifier table 223a that stores the recog- 
nition dictionary identifiers and input form identifiers in 
correspondence with each other, as shown in Fig. 5. 
[0027] A speech recognition module 224 executes 
speech recognition using the recognition dictionary or 
40 dictionaries 225 and user dictionary 1 24a designated for 
speech recognition by the dictionary management mod- 
ule 223 on the basis of the speech recognition data 124b 
and dictionary management information 124c received 
from the client 100. 
45 [0028] Note that the user dictionary 124a is prepared 
by the user to register recognition words which are to 
undergo speech recognition, and stores pronunciations 
and notations of words to be recognized in correspond- 
ence with each other, as shown in, e.g., Fig. 3. 
50 [0029] The speech recognition data 124b may be ei- 
ther speech data A/D-converted by the speech input 
module 121 or data obtained by encoding that speech 
data. 

[0030] The dictionary management information 124c 
55 indicates an input object and the like. For example, the 
dictionary management information 124c is an identifier 
(input form identifier) indicating the type of input form 
when the server 200 recognizes input speech and inputs 
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text data corresponding to that speech recognition result 
to each input form, which defines a speech input window 
displayed by the speech recognition system of the first 
embodiment, as shown in Fig. 4. The client 100 sends 
this inputformidentifierto the server200 as the dictionary 
management information 124c. In the server 200, the 
dictionary management module 223 looks up the identi- 
fier table 223a to acquire a recognition dictionary identi- 
fier corresponding to the received input form identifier, 
and determines a recognition dictionary 225 to be used 
in speech recognition. 

[0031] The process executed by the speech recogni- 
tion system of the first embodiment will be explained be- 
low using Fig. 6. 

[0032] Fig. 6 is a flow chart showing the process exe- 
cuted by the speech recognition system of the first em- 
bodiment. 

[0033] In step S101 , the client 100 sends the user dic- 
tionary 124a to the server 200. 

[0034] In step S201 , the server 200 receives the user 
dictionary 124a from the client 1 00. 
[0035] In step S1 02, when speech is input to an input 
form as a target speech input, the client 1 00 sends the 
input form identifier of that input form to the server 200 
as the dictionary management information 124c. 
[0036] In step S202, the server 200 receives the input 
form identifier from the client 100 as the dictionary man- 
agement information 124c. 

[0037] In step S203, the server 200 looks up the iden- 
tifier table 223a using the dictionary management infor- 
mation 124c to acquire a recognition dictionary identifier 
corresponding to the received input form identifier, and 
determines a recognition dictionary 225 to be used in 
speech recognition. 

[0038] In step S1 03, the client 1 00 sends speech rec- 
ognition data 1 24b, which is speech-input as text data to 
be input to each input form, to the server 200. 
[0039] In step S204, the server 200 receives the 
speech recognition data corresponding to each input 
form from the client 1 00. 

[0040] In step S205, the server 200 executes speech 
recognition of the speech recognition data 124b in the 
speech recognition module 224 using the recognition dic- 
tionary 225 and user dictionary 124a designated for 
speech recognition by the dictionary management mod- 
ule 223. 

[0041] In the first embodiment, all recognition words 
contained in the user dictionary 1 24a sent from the client 
1 00 to the server 200 are used in speech recognition by 
the speech recognition module 224. 
[0042] In step S206, the server 200 sends the speech 
recognition result obtained by the speech recognition 
module 224 to the client 1 00. 

[0043] In step S1 04, the client 1 00 receives the speech 
recognition result corresponding to each input form from 
the server 200, and stores text data corresponding to the 
speech recognition result in the corresponding input 
form. 



[0044] The client 100 checks in step S105 if the 
processing is to be ended. If the processing is not to be 
ended (NO in step S1 05), the flow returns to step S1 02 
to repeat the processing. On the other hand, if the 
5 processing is to be ended (YES in step S1 05), the client 
1 00 informs the server 200 of end of the processing, and 
ends the processing. 

[0045] It is checked in step S207 if a processing end 
instruction from the client 1 00 is detected. If no process- 

10 ing end instruction is detected (NO in step S207), the 
flow returns to step S202 to repeat the above processes. 
On the other hand, if the processing end instruction is 
detected (YES in step S207), the processing ends. 
[0046] In the above processing, when speech is input 

15 to an input form as a target speech input, the dictionary 
management information 124c corresponding to that in- 
put form is sent from the client 100 to the server 200. 
Alternatively, the dictionary management information 
1 24c may be sent when the input form as a target speech 

20 input is focused by an instruction from the input device 
106 (the input form as a target speech input is deter- 
mined). 

[0047] In the server 200, speech recognition is made 
after all speech recognition data 124b are received. Al- 
25 ternatively, every time speech is input as text data to a 
given input form, that the portion of speech recognition 
data 1 24b may be sent to the server 200 frame by frame 
(for example, one frame is 1 0 msec speech data), and 
speech recognition may be made in real time. 
30 [0048] As described above, according to the first em- 
bodiment, intheclient-serverspeech recognition system, 
since the server 200 executes speech recognition of 
speech recognition data 124b using both an appropriate 
recognition dictionary 225 and the user dictionary 124a, 
35 the speech recognition precision in the server 200 can 
be improved while reducing the processing load and use 
of storage resources associated with speech recognition 
in the client 100. 



[0049] I n the first embodiment, if no recognition words 
to be stored in the user dictionary 124a are generated, 
since the user dictionary 124a need not be used, the 

^5 server 200 may use all recognition words in the user dic- 
tionary 124a in recognition only when a use request of 
the user dictionary 1 24a is received from the client 1 00. 
[0050] I n this case, a flag indicating if the user diction- 
ary 1 24a is used is added as the dictionary management 

50 information 124c, thus informing the server 200 of the 
presence/absence of use of the user dictionary 124a. 

[Third Embodiment] 

55 [0051] Since some target recognition words in the user 
dictionary 124a are not used depending on an input ob- 
ject, situation, and the like, only specific recognition 
words in the user dictionary 1 24a may be used in recog- 
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nition depending on the input object and situation. 
[0052] In such case, when the user dictionary is man- 
aged by designating input form identifiers for respective 
recognition words, as shown in Fig. 7, only recognition 
words having an input form identifier of the input form 
used in speech input can be used in recognition. Alter- 
natively, a plurality of input form identifiers may be des- 
ignated for a given recognition word. In addition, the user 
dictionary may be managed by designating recognition 
dictionary identifiers in place of input form identifiers, as 
shown in Fig. 8. 

[Fourth Embodiment] 

[0053] By combining the second and third embodi- 
ments, the efficiency of the speech recognition process 
of the speech recognition module 224 can be further im- 
proved. 

[Fifth Embodiment] 

[0054] Most of the processes of the apparatus of the 
present invention can be implemented by programs. As 
described above, since the apparatus can use a general- 
purpose apparatus such as a personal computer, the 
present invention is also achieved by supplying a storage 
medium, which records a program code of a software 
program that can implement the functions of the above- 
mentioned embodiments to a system or apparatus, and 
reading out and executing the program code stored in 
the storage medium by a computer of the system or ap- 
paratus. In this case, the program code itself read out 
from the storage medium implements the functions of the 
above-mentioned embodiments, and the storage medi- 
um which stores the program code constitutes the 
present invention. As the storage medium for supplying 
the program code, for example, a floppy disk, hard disk, 
optical disk, magneto-optical disk, CD-ROM, magnetic 
tape, nonvolatile memory card, ROM, and the like may 
be used. 

[0055] The present invention can also be achieved by 
supplying the storage medium that records the program 
code to a computer, and executing some or all of actual 
processes executed by an OS running on the computer. 
Furthermore, the functions of the above-mentioned em- 
bodiments may be implemented by some or all of actual 
processing operations executed by a CPU or the like ar- 
ranged in a function extension board or a function exten- 
sion unit, which is inserted in or connected to the com- 
puter, after the program code read out from the storage 
medium is written in a memory of the extension board or 
unit. When the present invention is applied to the storage 
medium, that storage medium stores a program code 
corresponding to the flow chart shown in Fig. 3. 
[0056] As many apparently widely different embodi- 
ments of the present invention can be made without de- 
parting from the scope thereof, it is to be understood that 
the invention is not limited to the specific embodiments 



thereof except as defined in the appended claims. 



Claims 

5 

1 . A client-server speech recognition system for recog- 
nizing speech input at a client (1 00) by aserver (200), 
the client (100) comprising: 

10 speech input means (121, 123) for inputting 

speech; 

user dictionary holding means for holding a user 
dictionary (124a) formed by registering target 
recognition words designated by the user; and 
15 transmission means (122) for transmitting 

speech data (124b) input by said speech input 
means (121), dictionary management informa- 
tion (1 24c) used to determine a recognition field 
of a recognition dictionary used to recognize the 
20 speech data, and the user dictionary (124a) to 

the server (200), and 
the server (200) comprising: 

recognition dictionary holding means for 
25 holding a plurality of kinds of recognition dic- 

tionaries (225) prepared for respective rec- 
ognition fields; 

determination means (223) for determining 
one or more recognition dictionaries (225) 
30 corresponding to the dictionary manage- 

ment information (124c) received from the 
client (1 00) from the plurality of kinds of rec- 
ognition dictionaries (225) and the user dic- 
tionary (124a) received from the client 
35 (100); and 

recognition means (224) for recognizing the 
speech data (124b) using at least the rec- 
ognition dictionary (225) determined by said 
determination means (223). 

40 

2. The system according to claim 1 , wherein said rec- 
ognition means (224) is operable to recognize the 
speech data (124b) using the recognition dictionary 
(225) determined by said determination means 

45 (223), and the user dictionary (124a) received from 
the client (100). 

3. The system according to claim 1 or 2, wherein said 
speech input means (121, 123) comprises display 

50 means (1 23) for displaying an input form as a target 
speech input, and wherein the dictionary manage- 
ment information (124c) is an input form identifier 
that indicates a type of input form. 

55 4. The system according to any of claims 1 to 3, wherein 
the dictionary management information (124c) con- 
tains information indicating if the user dictionary 
(124a) is to be used in recognition of the speech data 
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(124b). 

5. The system according to any preceding claim, 
wherein the user dictionary (1 24a) is formed by stor- 
ing pronunciations and notations of the target rec- 
ognition words in correspondence with each other. 

6. The system according to claim 3, wherein the user 
dictionary (124a) is formed by also storing at least 
one input form identifier and the target recognition 
words in correspondence with each other. 

7. The system according to any preceding claim, 
wherein the user dictionary (124a) is formed by also 
storing at least one of recognition dictionary identifi- 
ers indicating recognition fields of the plurality of 
kinds of recognition dictionaries, and the target rec- 
ognition words. 

8. The system according to any preceding claim, 
wherein the speech data (124b) is data obtained by 
encoding that speech data. 

9. A method of controlling a client-server speech rec- 
ognition system for recognizing speech input at a 
client (100) by a server (200), comprising: 

a speech input step of inputting speech; and 
a transmission step of transmitting speech data 
(1 24b) input in the speech input step, dictionary 
management information (124c) used to deter- 
mine a recognition field of a recognition diction- 
ary used to recognize the speech data, and a 
user dictionary (124a) held in the client (100) 
which is formed by registering target recognition 
words designated by a user, to the server; 
a determination step of determining one or more 
recognition dictionaries (225) corresponding to 
the dictionary management information (124c) 
received from the client (1 00) from a plurality of 
kinds of recognition dictionaries (225) held in the 
server (200), which are prepared for respective 
recognition fields, and the user dictionary (124a) 
received from the client (100); and 
a recognition step of recognizing the speech da- 
ta (1 24b) using at least the recognition dictionary 
(225) determined in the determination step. 

10. The method according to claim 9, wherein the rec- 
ognition step includes a step of recognizing the 
speech data (124b) using the recognition dictionary 
(225) determined in the determination step, and the 
user dictionary (1 24a) received from the client (1 00). 

11. The method according to claim 9 or 1 0, wherein the 
speech input step comprises a display step of dis- 
playing an input form as a target speech input, and 
wherein the dictionary management information 



(1 24c) is an input form identifier that indicates a type 
of input form. 

12. The method according to any of claims 9 to 11, 
5 wherein the dictionary management information 
(124c) contains information indicating if the user dic- 
tionary (124a) is to be used in recognition of the 
speech data (124b). 

10 13. The method according to any of claims 9 to 12, 
wherein the user dictionary (124a) is formed by stor- 
ing pronunciations and notations of the target rec- 
ognition words in correspondence with each other. 

15 1 4. The method according to claim 1 1 , wherein the user 
dictionary (124a) is formed by also storing at least 
one input form identifier and the target recognition 
words in correspondence with each other. 

20 15. The method according to any of claims 9 to 14, 
wherein the user dictionary (1 24a) is formed by also 
storing at least one of recognition dictionary identifi- 
ers indicating recognition fields of the plurality of 
kinds of recognition dictionaries, and the target rec- 
25 ognition words. 

16. The method according to any of claims 9 to 15, 
wherein the speech data (124b) is data obtained by 
encoding that speech data. 

30 

1 7. A computer readable memory that stores a program 
code of control of a client-server speech recognition 
system for recognizing speech input at a client by a 
server, comprising: 

35 

a program code of a speech input step of input- 
ting speech; 

a program code of a transmission step of trans- 
mitting speech data (124b) input in the speech 
40 input step, dictionary management information 

(124c) used to determine a recognition field of 
a recognition dictionary used to recognize the 
speech data, and a user dictionary (124a) held 
in the client (1 00) which is formed by registering 
45 target recognition words designated by the user, 

to the server (200) 

a program code of a determination step of de- 
termining one or more recognition dictionaries 
(225) corresponding to the dictionary manage- 
50 ment information (1 24c) received from the client 

(1 00) from a plurality of kinds of recognition dic- 
tionaries (225) held in the server (200) which are 
prepared for respective recognition fields, and 
the user dictionary (124a) received from the cli- 
55 ent(100);and 

a program code of a recognition step of recog- 
nizing the speech data (1 24b) using at least the 
recognition dictionary (225) determined in the 
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determination step. 

18. A speech recognition server (200) for recognizing 
speech input at a client (1 00), and sending a recog- 
nition result to the client (1 00), comprising: 



speech input means (121, 123) comprises display 
means (1 23) for displaying an input form as a target 
speech input, and wherein the dictionary manage- 
ment information (124c) is an input form identifier 
5 that indicates a type of input form. 



24. 



reception means for receiving, from the client 23. 
(100), speech data (124b), dictionary manage- 
ment information (124c) used to determine a 
recognition field of a recognition dictionary used 10 
to recognize the speech data, and a user dic- 
tionary (124a) formed by registering target rec- 
ognition words designated by a user; 
recognition dictionary holding means for holding 
a plurality of kinds of recognition dictionaries 
(225) prepared for respective recognition fields; 
determination means (223) for determining one 
or more recognition dictionaries (225) corre- 
sponding to the dictionary management infor- 
mation (124c) received from the client (100) from 20 
the plurality of kinds of recognition dictionaries 
(225) and the user dictionary (124a) received 26. 
from the client (100); and 
recognition means (224) for recognizing the 
speech data using at least the recognition die- 25 
tionary (225) determined by said determination 
means (223). 



The client according to claim 21 or 22, wherein the 
dictionary management information (124c) contains 
information indicating if the user dictionary (124a) is 
to be used in recognition of the speech data. 

The client according to any of claims 21 to 23, where- 
in the user dictionary (1 24a) is formed by storing pro- 
nunciations and notations of the target recognition 
words in correspondence with each other. 



25. The client according to claim 22, wherein the user 
dictionary (124a) is formed by also storing at least 
one input form identifier and the target recognition 
words in correspondence with each other. 



The client according to any of claims 21 to 25, where- 
in the user dictionary (124a) is formed by also storing 
at least one of recognition dictionary identifiers indi- 
cating recognition fields of the plurality of kinds of 
recognition dictionaries, and the target recognition 
words. 



1 9. The server according to claim 1 8, wherein said rec- 
ognition means (224) is operable to recognize the 
speech data (124b) using the recognition dictionary 
(225) determined by said determination means 
(223), and the user dictionary (124a) received from 
the client (100). 

20. The server according to claim 1 8 or 1 9, wherein the 
speech data (124b) is data obtained by encoding 
that speech data. 

21. A speech recognition client (100) for sending input 
speech to be recognized to a server (200), and re- 
ceiving a recognition result of that speech, compris- 
ing: 

speech input means (121, 123) for inputting 
speech; 

user dictionary holding means for holding a user 
dictionary (124a) formed by registering target 
recognition words designated by a user; and 
transmission means (122) for transmitting 
speech data (124b) input by said speech input 
means, dictionary management information 
(124c) used to determine a recognition field of 
a recognition dictionary used to recognize the 
speech data, and the user dictionary (124a) to 
the server (200). 

22. The client according to claim 21, wherein said 



27. The client according to any of claims 21 to 25, where- 
to in the speech data (1 24b) is data obtained by encod- 
ing that speech data. 

28. A method of controlling a speech recognition server 
(200) for recognizing speech input at a client (100), 

35 and sending a recognition result to the client (100), 
comprising: 

a reception step of receiving, from the client, 
speech data (124b), dictionary management in- 
40 formation (124c) used to determine a recogni- 

tion field of a recognition dictionary used to rec- 
ognize the speech data, and a user dictionary 
(124a) formed by registering target recognition 
words designated by a user; 
45 a determination step of determining one or more 

recognition dictionaries (225) corresponding to 
the dictionary management information (124c) 
received from the client (1 00) from a plurality of 
kinds of recognition dictionaries (225) held in the 
50 server (200), which are prepared for respective 

recognition fields, and the user dictionary (1 24a) 
received from the client (100); and 
a recognition step of recognizing the speech da- 
ta (1 24b) using at leastthe recognition dictionary 
55 (225) determined in the determination step. 

29. The method according to claim 28, wherein the rec- 
ognition step includes a step of recognizing the 
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speech data (124b) using the recognition dictionary 
(225) determined in the determination step, and the 
user dictionary (1 24a) received from the client (1 00). 

30. The method according to claim 28 or 29, wherein the 
speech data (124b) is data obtained by encoding 
that speech data. 

31. A method of controlling a speech recognition client 
(100) for sending input speech to be recognized to 
a server (200), and receiving a recognition result of 
that speech, comprising: 

a speech input step of inputting speech; and 
a transmission step of transmitting speech data 
(124b) input in the speech input step, dictionary 
management information (124c) used to deter- 
mine a recognition field of a recognition diction- 
ary used to recognize the speech data, and a 
user dictionary (124a) held in the client (100) 
which is formed by registering target recognition 
words designated by a user, to the server (200). 

32. The method according to claim 31, wherein the 
speech input step comprises a display step of dis- 
playing an input form as a target speech input, and 
wherein the dictionary management information 
(1 24c) is an input form identifier that indicates a type 
of input form. 

33. The method according to claim 31 or 32, wherein the 
dictionary management information (124c) contains 
information indicating if the user dictionary (124a) is 
to be used in recognition of the speech data (124b). 

34. The method according to any of claims 31 to 33, 
wherein the user dictionary (1 24a) is formed by stor- 
ing pronunciations and notations of the target rec- 
ognition words in correspondence with each other. 

35. The method according to claim 32, wherein the user 
dictionary (124a) is formed by also storing at least 
one input form identifier and the target recognition 
words in correspondence with each other. 

36. The method according to any of claims 31 to 35, 
wherein the user dictionary (124a) is formed by also 
storing at least one of recognition dictionary identifi- 
ers indicating recognition fields of the plurality of 
kinds of recognition dictionaries, and the target rec- 
ognition words. 

37. The method according to any of claims 31 to 36, 
wherein the speech data (124b) is data obtained by 
encoding that speech data. 

38. A computer readable memory that stores a program 
code of control of a speech recognition server (200) 



for recognizing speech input at a client (100), and 
sending a recognition result to the client (1 00), com- 
prising: 

5 a program code of a reception step of receiving, 

from the client (100), speech data (124b), dic- 
tionary management information (1 24c) used to 
determine a recognition field of a recognition dic- 
tionary used to recognize the speech data, and 
10 a user dictionary (124a) formed by registering 

target recognition words designated by a user; 
a program code of a determination step of de- 
termining one or more recognition dictionaries 
(225) corresponding to the dictionary manage- 
rs ment information (1 24c) received from the client 
(1 00) from a plurality of kinds of recognition dic- 
tionaries (225) held in the server (200), which 
are prepared for respective recognition fields, 
and the user dictionary (1 24a) received from the 
20 client (100); and 

a program code of a recognition step of recog- 
nizing the speech data (1 24b) using at least the 
recognition dictionary (225) determined in the 
determination step. 

25 

39. A computer readable memory that stores a program 
code of control of a speech recognition client (100) 
forsending input speech to be recognized to a server 
(200), and receiving a recognition result of that 

30 speech, comprising: 

a program code of a speech input step of input- 
ting speech; and 

a program code of a transmission step of trans- 
35 mitting speech data (124b) input in the speech 

input step, dictionary management information 
(124c) used to determine a recognition field of 
a recognition dictionary used to recognize the 
speech data, and a user dictionary (124a) held 
40 in the client (1 00) which is formed by registering 

target recognition words designated by a user, 
to the server (200). 

40. Processor implementable instructions product caus- 
es ing a programmable computer device to carry out all 

the steps of the method of any of claims 28 to 37, 
when the instructions product is run on said program- 
mable computer device. 



1. Client-/Server-Spracherkennungssystem zum Er- 
kennen einer Spracheingabe bei einem Client (1 00) 
55 durch einen Server (200), 

wobei der Client (100) umfasst: 

eine Spracheingabeeinrichtung (1 21 , 1 23) zum 



20 



25 



35 



40 



50 

Patentanspriiche 



8 



15 



EP 1 209 662 B1 



16 



Eingeben von Sprache, 

eine Benutzerworterbuchhalteeinrichtung zum 
Halten eines Benutzerworterbuchs (124a), das 
durch Registrierenvondurchden Benutzeraus- 
gewiesenen Zielerkennungswortern ausgebil- 5 
det ist, und 

eine Ubertragungseinrichtung (122) zum Uber- 
tragen von durch die Spracheingabeeinrichtung 
(121) eingegebenen Sprachdaten (124b), von 
Worterbuchverwaltungsinformationen (124c), 10 
die zum Bestimmen eines Erkennungsfeldes ei- 
nes zum Erkennen der Sprachdaten verwende- 
ten Erkennungsworterbuchs verwendet wer- 
den, und des Benutzerworterbuchs (124a) zu 
dem Server (200), und 15 

wobei der Server (200) umfasst: 

eine Erkennungsworterbuchhalteeinrichtung 
zum Halten einer Vielzahl von Arten von Erken- 20 
nungsworterbuchern (225), die fur jeweilige Er- 
kennungsfelder ausgebildet sind, 
eine Bestimmungseinrichtung (223) zum Be- 
stimmen von einem oder mehreren Erken- 
nungsworterbuchern (225), die den von dem Cli- 25 
ent (100) empfangenen Worterbuchverwal- 
tungsinformationen (124c) entsprechen, aus 
der Vielzahl von Arten von Erken nungsworter- 
buchern (225) und dem von dem Client (100) 
empfangenen Benutzerworterbuch (124a), und 30 
eine Erkennungseinrichtung (224) zum Erken- 
nen der Sprachdaten (124b) unter Verwendung 
zumindest des durch die Bestimmungseinrich- 
tung (223) bestimmten Erkennungsworterbuchs 
(225). 35 

2. System gemaB Anspruch 1 , wobei die Erkennungs- 
einrichtung (224) zum Erkennen der Sprachdaten 
(124b) unter Verwendung des durch die Bestim- 
mungseinrichtung (223) bestimmten Erkennungs- 40 
worterbuchs (225) und des von dem Client (100) 
empfangenen Benutzerworterbuchs (124a) betreib- 
bar ist. 

3. System gemaB Anspruch 1 oder 2, wobei die 45 
Spracheingabeeinrichtung (121, 1 23) eine Anzeige- 
einrichtung (123) zum Anzeigen einer Eingabemas- 

ke als eine Zielspracheingabe umfasst, und wobei 
die Wo rterb u ch ve rwa It ungs information en (124c) ei- 
ne Eingabenmaskenkennungdarstellen, die eine Art 50 
der Eingabemaske angibt. 

4. System gemaB einem der Anspruche 1 bis 3, wobei 
die Worterbuchverwaltungsinformationen (124c) In- 
formationen enthalten, die angeben, ob das Benut- 55 
zerworterbuch (124a) bei einer Erkennung der 
Sprachdaten (124b) zu verwenden ist. 



5. System gemaB einem dervorstehenden Anspruche, 
wobei das Benutzerworterbuch (124a) durch Spei- 
chern von Aussprachen und Schreibweisen derZie- 
lerkennungsworter in Entsprechung miteinander 
ausgebildet ist. 

6. System gemaB Anspruch 3, wobei das Benutzerwor- 
terbuch (124a) ebenso durch Speichern von zumin- 
dest einer Eingabemaskekennung und den Zieler- 
kennungswortern in Entsprechung miteinander aus- 
gebildet ist. 

7. System gemaB einem dervorstehenden Anspruche, 
wobei das Benutzerworterbuch (124a) ebenso durch 
Speichern von zumindest einer Erken nun gsworter- 
buchkennung, die Erkennungsfelder der Vielzahl 
von Arten von Erkennungsworterbuchern angibt, 
und der Zielerkennungsworter ausgebildet ist. 

8. System gemaB einem dervorstehenden Anspruche, 
wobei die Sprachdaten (124b) durch Codierung je- 
ner Sprachdaten erhaltene Daten sind. 

9. Verfahren zum Steuern eines ClienWServer- 
Spracherkennungssystems zum Erkennen einer 
Spracheingabe bei einem Client (100) durch einen 
Server (200), mit: 

einem Spracheingabeschrittdes Eingebens von 
Sprache, und 

einem Ubertragungsschritt des Ubertragens 
von in dem Spracheingabeschritteingegebenen 
Sprachdaten (124b), von Worterbuchverwal- 
tungsinformationen (124c), die zum Bestimmen 
eines Erkennungsfeldes eines zum Erkennen 
der Sprachdaten verwendeten Erkennungswor- 
terbuchs verwendet werden, und eines in dem 
Client (100) gehaltenen Benutzerworterbuchs 
(124a), das durch ein Registrieren von durch ei- 
nen Benutzer ausgewiesenen Zielerkennungs- 
wortern ausgebildet ist, zu dem Server, 
einem Bestimmungsschritt des Bestimmens 
von einem oder mehreren Erkennungsworter- 
buchern (225), die den von dem Client (100) 
empfangenen Worterbuchverwaltungsinforma- 
tionen entsprechen, aus einer Vielzahl von Ar- 
ten von in dem Server (200) gehaltenen Erken- 
nungsworterbuchern (225), die fur jeweilige Er- 
kennungsfelder ausgebildet sind, und dem von 
dem Client (1 00) empfangenen Benutzerworter- 
buch (124a), und 

einem Erkennungsschritt des Erkennens der 
Sprachdaten (124b) unter Verwendung zumin- 
dest des in dem Bestimmungsschritt bestimm- 
ten Erkennungsworterbuchs (225). 

10. Verfahren gemaB Anspruch 9, wobei der Erken- 
nungsschritt einen Schritt des Erkennens der 
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Sprachdaten (124b) unter Verwendung des in dem 
Bestimmungsschritt bestimmten Erkennungswor- 
terbuchs (225) und des von dem Client (100) emp- 
fangenen Benutzerworterbuchs (124a) enthalt. 

5 

11. Verfahren gemaB Anspruch 9 Oder 10, wobei der 
Spracheingabeschritt einen Anzeigeschritt des An- 
zeigens einer Eingabemaske als eine Zielsprachein- 
gabe umfasst, und wobei die Worterbuchverwal- 
tungsinformationen (124c) eine Eingabemasken- 10 
kennung darstellen, die eine Art von Eingabemaske 
angibt. 

12. Verfahren gemaB einem der Anspruche 9 bis 11 , 
wobei die Worterbuchverwaltungsinformationen is 
(1 24c) Informationen enthalten, die angeben, ob das 
Benutzerworterbuch (1 24a) bei einer Erkennung der 
Sprachdaten (124b) zu verwenden ist. 

13. Verfahren gemaB einem der Anspruche 9 bis 12, 20 
wobei das Benutzerworterbuch (124a) durch Spei- 
chern von Aussprachen und Schreibweisen der Zie- 
lerkennungsworter in Entsprechung miteinander 
ausgebildet wird. 

25 

14. Verfahren gemaB Anspruch 11, wobei das Benut- 
zerworterbuch (124a) ebenso durch Speichern von 
zumindest einer Eingabemaskenkennung und der 
Zielerkennungsworter in Entsprechung miteinander 
ausgebildet wird. 30 

15. Verfahren gemaB einem der Anspruche 9 bis 14, 
wobei das Benutzerworterbuch (1 24a) ebenso durch 
Speichern von zumindest einer Erkennungsworter- 
buchkennung, die Erkennungsfelder der Vielzahl 35 
von Arten von Erkennungsworterbuchern angibt, 
und der Zielerkennungsworter ausgebildet wird. 

16. Verfahren gemaB einem der Anspruche 9 bis 15, 
wobei die Sprachdaten (1 24b) durch Codieren jener 40 
Sprachdaten erhaltene Daten sind. 

17. Computerlesbarer Speicher, der einen Programm- 
code zur Steuerung eines ClientVServer-Spracher- 
kennungssystems zum Erkennen einer Sprachein- 45 
gabe bei einem Client durch einen Server speichert, 
mit: 

einem Programmcode eines Spracheingabe- 
schritts des Eingebens von Sprache, 50 
einem Programmcode eines Ubertragungs- 
schritts des Ubertragens von in dem Sprachein- 
gabeschritt eingegebenen Sprachdaten (1 24b), 
von Worterbuchverwaltungsinformationen 
(124c), die zum Bestimmen eines Erkennungs- 55 
feldes eines zum Erkennen der Sprachdaten 
verwendeten Erkennungsworterbuchs verwen- 
det werden, und eines in dem Client (100) ge- 
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haltenen Benutzerworterbuchs (124a), das 
durch Registrieren von durch den Benutzeraus- 
gewiesenen Zielerkennungswortern ausgebil- 
det ist, zu dem Server (200), 
einem Programmcode eines Bestimmungs- 
schritts des Bestimmens von einem oder meh- 
reren Erkennungsworterbuchern (225), die den 
von dem Client (100) empfangenen Worter- 
buchverwaltungsinformationen (124c) entspre- 
chen, aus einer Vielzahl von Arten von in dem 
Server (200) gehaltenen Erkennungsworterbu- 
chern (225), die furjeweilige Erkennungsfelder 
ausgebildet sind, und dem von dem Client (1 00) 
empfangenen Benutzerworterbuch (124a), und 
einem Programmcode eines Erkennungs- 
schritts des Erkennens der Sprachdaten (124b) 
unter Verwendung zumindest des in dem Be- 
stimmungsschritt bestimmten Erkennungswor- 
terbuchs (225). 

1 8. Spracherkennungsserver (200) zum Erkennen einer 
Spracheingabe bei einem Client (1 00) und zum Sen- 
den eines Erkennungsergebnisses zu dem Client 
(100), mit: 

einer Empfangseinrichtung zum Empfangen 
von dem Client (100) von Sprachdaten (124b), 
von Worterbuchverwaltungsinformationen 
(124c), die zum Bestimmen eines Erkennungs- 
feldes eines zum Erkennen der Sprachdaten 
verwendeten Erkennungsworterbuchs verwen- 
det sind, und eines Benutzerworterbuchs 
(124a), das durch Registrieren von durch einen 
Benutzer ausgewiesenen Zielerkennungswor- 
tern ausgebildet ist, 

einer Erkennungsworterbuchhalteeinrichtung 
zum Halten einer Vielzahl von Arten von furje- 
weilige Erkennungsfelder ausgebildeten Erken- 
nungsworterbuchern (225), 
einer Bestimmungseinrichtung (223) zum Be- 
stimmen von einem oder mehreren Erken- 
nungsworterbuchern (225), die den von dem Cli- 
ent (100) empfangenen Worterbuchverwal- 
tungsinformationen (124c) entsprechen, aus 
der Vielzahl von Arten von Erkennungsworter- 
buchern (225) und dem von dem Client (100) 
empfangenen Benutzerworterbuch (124a), und 
einer Erkennungseinrichtung (224) zum Erken- 
nen der Sprachdaten unter Verwendung zumin- 
dest des durch die Bestimmungseinrichtung 
(223) bestimmten Erkennungsworterbuchs 
(225). 

1 9. Server gemaB Anspruch 1 8, wobei die Erkennungs- 
einrichtung (224) zum Erkennen der Sprachdaten 
(124b) unter Verwendung des durch die Bestim- 
mungseinrichtung (223) bestimmten Erkennungs- 
worterbuchs (225) und des von dem Client (100) 
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empfangenen Benutzerworterbuchs (124a) betreib- 
bar ist. 

20. Server gemaB Anspruch 18 oder 19, wobei die 
Sprachdaten (124b) durch Codieren jener Sprach- 5 
daten erhaltene Daten sind. 

21. Spracherkennungsclient (100) zum Senden von 
durch einen Server (200) zu erkennender Eingabe- 
sprache und zum Empfangen eines Erkennungser- 10 
gebnisses jener Sprache, mit: 

einerSpracheingabeeinrichtung (121 , 123) zum 
Eingeben von Sprache, 

einer Benutzerworterbuchhalteeinrichtung zum 15 
Halten eines Benutzerworterbuchs (124a), das 
durch Registrieren von durch einen Benutzer 
ausgewiesenen Zielerkennungswortern ausge- 
bildet ist, und 

einer Ubertragungseinrichtung (1 22) zum Uber- 20 
tragen von durch die Spracheingabeeinrichtung 
eingegebenen Sprachdaten (124b), von W6r- 
terbuchverwaltungsinformationen (124c), die 
zum Bestimmen eines Erkennungsfeldes eines 
zum Erkennen der Sprachdaten verwendeten 25 
Erkennungsworterbuchs verwendet sind, und 
des Benutzerworterbuchs (1 24a) zu dem Server 
(200). 

22. Client gemaB Anspruch 21 , wobei die Spracheinga- 30 
beeinrichtung (121, 123) eine Anzeigeeinrichtung 
(123) zum Anzeigen einer Eingabemaske als eine 
Zielspracheingabe umfasst, und wobei die Worter- 
buchverwaltungsinformationen (124c) eine Einga- 
bemaskenkennung darstellen, die eine Art von Ein- 35 
gabemaske angibt. 

23. Client gemaB Anspruch 21 oder 22, wobei die Wor- 
terbuchverwaltungsinformationen (124c) Informa- 
tionen enthalten, die angeben, ob das Benutzerwor- 40 
terbuch (124a) bei einer Erkennung der Sprachda- 
ten zu verwenden ist. 

24. Client gemaB einem der Anspmche 21 bis 23, wobei 
das Benutzerworterbuch (124a) durch Speichern 45 
von Aussprachen und Schreibweisen derZielerken- 
nungsworter in Entsprechung miteinanderausgebil- 

det ist. 



nung, die Erkennungsfelder der Vielzahl von Arten 
von Erkennungsworterbuchern angibt, und derZie- 
lerkennungsworter ausgebildet ist. 

27. ClientgemaB einem der Anspmche 21 bis 25, wobei 
die Sprachdaten (124b) durch Codieren jener 
Sprachdaten erhaltene Daten sind. 

28. Verfahren zum Steuern eines Spracherkennungs- 
servers (200) zum Erkennen einer Spracheingabe 
bei einem Client (100) und zum Senden eines Er- 
kennungsergebnisses zu dem Client (100), mit: 

einem Empfangsschritt des Empfangens von 
dem Client von Sprachdaten (124b), von Wor- 
terbuchverwaltungsinformationen (124c), die 
zum Bestimmen eines Erkennungsfeldes eines 
zum Erkennen der Sprachdaten verwendeten 
Erkennungsworterbuchs verwendet sind, und 
eines Benutzerworterbuchs (124a), das durch 
Registrieren von durch einen Benutzer ausge- 
wiesenen Zielerkennungswortern ausgebildet 
ist, 

einem Bestimmungsschritt des Bestimmens 
von einem oder mehreren Erkennungsworter- 
buchern (225), die den von dem Client (100) 
empfangenen Worterbuchverwaltungsinforma- 
tionen (124c) entsprechen, aus einer Vielzahl 
von Arten von in dem Server (200) gehaltenen 
Erkennungsworterbuchern (225), die fur jewei- 
lige Erkennungsfelder ausgebildet sind, und 
dem von dem Client (1 00) empfangenen Benut- 
zerworterbuch (124a), und 
einem Erkennungsschritt des Erkennens der 
Sprachdaten (124b) unter Verwendung zumin- 
dest des in dem Bestimmungsschritt bestimm- 
ten Erkennungsworterbuchs (225). 

29. Verfahren gemaB Anspruch 28, wobei der Erken- 
nungsschritt einen Schritt des Erkennens der 
Sprachdaten (124b) unter Verwendung des in dem 
Bestimmungsschritt bestimmten Erkennungswor- 
terbuchs (225) und des von dem Client (100) emp- 
fangenen Benutzerworterbuchs (124a) enthalt. 

30. Verfahren gemaB Anspruch 28 oder 29, wobei die 
Sprachdaten (124b) durch Codieren jener Sprach- 
daten erhaltene Daten sind. 



25. Client gemaB Anspruch 22, wobei das Benutzerwor- 50 31. Verfahren zum Steuern eines Spracherkennungscli- 
terbuch (124a) ebenso durch Speichern zumindest ents (100) zum Senden von durch einen Server (200) 
einer Eingabemaskenkennung und der Zielerken- zu erkennender Eingabesprache und zum Empfan- 
nungsworter in Entsprechung miteinander ausgebil- gen eines Erkennungsergebnisses von jener Spra- 
det ist. che, mit: 

55 

26. Client gemaB einem der Anspriiche 21 bis 25, wobei einem Spracheingabeschrittdes Eingebens von 
das Benutzerworterbuch (1 24a) ebenso durch Spei- Sprache, und 

chern zumindest einer Erkennungsworterbuchken- einem Ubertragungsschritt des Ubertragens 
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von in dem Spracheingabeschritt eingegebenen 
Sprachdaten (124b), von Worterbuchverwal- 
tungsinformationen (124c), diezum Bestimmen 
eines Erkennungsfeldes eines zum Erkennen 
der Sprachdaten verwendeten Erkennungswor- 5 
terbuchs verwendet sind, und eines in dem Cli- 
ent (100) gehaltenen Benutzerworterbuchs 
(124a), das durch Registrieren von durch einen 
Benutzer ausgewiesenen Zielerkennungswor- 
tern ausgebildet ist, zu dem Server (200). 10 

32. Verfahren gemaB Anspruch 31, wobei der Sprach- 
eingabeschritt einen Anzeigeschritt des Anzeigens 
einer Eingabemaske als eine Zielspracheingabe 
umfasst, und wobei die Worterbuchverwaltungsin- is 
formationen (124c) eine Eingabemaskenkennung 
darstellen, die eine Art von Eingabemaske angibt. 

33. Verfahren gemaB Anspruch 31 oder 32, wobei die 
Worterbuchverwaltungsinformationen (124c) Infor- 20 
mationen enthalten, die angeben, ob das Benutzer- 
worterbuch (124a) bei einer Erkennung der Sprach- 
daten (124b) zu verwenden ist. 

34. Verfahren gemaB einem der Anspruche 31 bis 33, 25 
wobei das Benutzerworterbuch (124a) durch Spei- 
chernvon Aussprachen und Schreibweisen derZie- 
lerkennungsworter in Entsprechung miteinander 
ausgebildet ist. 

30 

35. Verfahren gemaB Anspruch 32, wobei das Benut- 
zerworterbuch (124a) ebenso durch Speichern zu- 
mindest einer Eingabemaskenkennung und derZie- 
lerkennungsworter in Entsprechung miteinander 
ausgebildet ist. 35 

36. Verfahren gemaB einem der Anspruche 31 bis 35, 
wobei das Benutzerworterbuch (1 24a) ebenso durch 
Speichern zumindest einer Erkennungsworterbuch- 
kennung, die Erkennungsfelder der Vielzahl von Ar- 40 
ten von Erkennungsworterbuchern angibt, und der 
Zielerkennungsworter ausgebildet ist. 

37. Verfahren gemaB einem der Anspruche 31 bis 36, 
wobei die Sprachdaten (1 24b) durch Codieren jener 45 
Sprachdaten erhaltene Daten sind. 

38. Computerlesbarer Speicher, der einen Programm- 
code zur Steuerung eines Spracherkennungsser- 
vers (200) zum Erkennen einer Spracheingabe bei 50 
einem Client (100) und zum Senden eines Erken- 
nungsergebnisses zu dem Client (100) speichert, 
mit: 

einem Programmcode eines Empfangsschritts 55 
des Empfangens von dem Client (100) von 
Sprachdaten (124b), von Worterbuchverwal- 
tungsinformationen (124c), diezum Bestimmen 



eines Erkennungsfeldes eines zum Erkennen 
der Sprachdaten verwendeten Erkennungswor- 
terbuchs verwendet sind, und eines Benutzer- 
worterbuchs (124a), das durch Registrieren von 
durch einen Benutzer ausgewiesenen Zieler- 
kennungswortern ausgebildet ist, 
einem Programmcode eines Bestimmungs- 
schritts des Bestimmens von einem oder meh- 
reren Erkennungsworterbuchern (225), die den 
von dem Client (100) empfangenen Worter- 
buchverwaltungsinformationen (124c) entspre- 
chen, aus einer Vielzahl von Arten von in dem 
Server (200) gehaltenen Erkennungsworterbu- 
chern (225), die furjeweilige Erkennungsfelder 
ausgebildetsind, und dem von dem Client(1 00) 
empfangenen Benutzerworterbuch (124a), und 
einem Programmcode eines Erkennungs- 
schritts des Erkennens der Sprachdaten (124b) 
unter Verwendung zumindest des in dem Be- 
stimmungsschritt bestimmten Erkennungswor- 
terbuchs (225). 

39. Computerlesbarer Speicher, der einen Programm- 
code zur Steuerung eines Spracherkennungsclients 
(100) zum Senden einer durch einen Server (200) 
zu erkennenden Eingabesprache und zum Empfan- 
gen eines Erkennungsergebnisses jener Sprache 
speichert, mit: 

einem Programmcode eines Spracheingabe- 
schritts des Eingebens von Sprache, und 
einem Programmcode eines Ubertragungs- 
schritts des Ubertragens von in dem Sprachein- 
gabeschritt eingegebenen Sprachdaten (124b), 
von Worterbuchverwaltungsinformationen 
(124c), die zum Bestimmen eines Erkennungs- 
feldes eines zum Erkennen der Sprachdaten 
verwendeten Erkennungsworterbuchs verwen- 
det sind, und eines in dem Client (1 00) gehalte- 
nen Benutzerworterbuchs (124a), das durch 
Registrieren von durch einen Benutzer ausge- 
wiesenen Zielerkennungswortern ausgebildet 
ist, zu dem Server (200). 

40. Prozessorimplementierbares Anweisungsprodukt, 
das eine programmierbare Computervorrichtung 
veranlasst, alle Schritte des Verfahrens gemaB ei- 
nem der Anspruche 28 bis 37 auszufuhren, wenn 
das Anweisungsprodukt auf der programmierbaren 
Computervorrichtung lauft. 



Revendications 

1 . Systeme client-serveur de reconnaissance de la pa- 
role pour la reconnaissance par un serveur (200) de 
la parole fournie en entree sur un client (100), 
le client (1 00) comprenant : 
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un moyen d'entree de parole (121, 123) pour 
fournir en entree de la parole ; 
un moyen de conservation de dictionnaire per- 
sonnel pourconserver un dictionnaire personnel 
(124a) forme en enregistrant des mots de re- 5 
connaissance cibles designes par I'utilisateur ; 
et 

un moyen de transmission (122) pourtransmet- 
tre au serveur (200) des donnees de parole 
(1 24b) fournies en entree par ledit moyen d'en- 10 
tree de parole (121), des informations degestion 
de dictionnaire (124c) utilisees pour determiner 
un domaine de reconnaissance d'un dictionnai- 
re de reconnaissance utilise pour reconnaTtre 
les donnees de parole, et le dictionnaire person- is 
nel (124a), et 

le serveur (200) comprenant : 

un moyen de conservation de dictionnaire 
de reconnaissance pour conserver une plu- 20 
ralite de types de diction naires de recon- 
naissance (225) prepares pour des domai- 
nes de reconnaissance respectifs ; 
un moyen de determination (223) pour de- 
terminer un ouplusieursdictionnairesdere- 25 
connaissance (225) correspondant aux in- 
formations de gestion de dictionnaires 
(124c) recues du client (100) a partir de la 
pluralite de types de dictionnaires de recon- 
naissance (225) et du dictionnaire person- 30 
nel (124a) recu du client (100) ; et 
un moyen de reconnaissance (224) pour re- 
connaTtre les donnees de parole (124b) en 
utilisant au moins le dictionnaire de recon- 
naissance (225) determine par ledit moyen 35 
de determination (223). 

2. Systeme selon la revendication 1, dans lequel ledit 
moyen de reconnaissance (224) a pourfonction de 
reconnaTtre les donnees de parole (1 24b) en utilisant 40 
le dictionnaire de reconnaissance (225) determine 

par ledit moyen de determination (223) et le diction- 
naire personnel (124a) recu du client (100). 

3. Systeme selon la revendication 1 ou 2, dans lequel 45 
ledit moyen d'entree de parole (121, 1 23) comprend 

un moyen d'affichage (1 23) pour afficher une formule 
d'entree en tant qu'entree de parole cible, et dans 
lequel les informations de gestion de dictionnaires 
(124c) sont un identificateur de forme d'entree qui 50 
indique un type de forme d'entree. 

4. Systeme selon Tune quelconque des revendications 
1 a 3, dans lequel les informations de gestion de 
dictionnaires (124c) contiennent des informations in- 55 
diquant si le dictionnaire personnel (124a) doit etre 
utilise dans la reconnaissance des donnees de pa- 
role (124b). 



5. Systeme selon Tune quelconque des revendications 
precedentes, dans lequel le dictionnaire personnel 
(124a) est forme en stockant des prononciations et 
des notations des mots de reconnaissance cibles en 
correspondance les uns avec les autres. 

6. Systeme selon la revendication 3, dans lequel le dic- 
tionnaire personnel (124a) est forme en stockant 
egalement au moins un identificateur de forme d'en- 
tree et les mots de reconnaissance cibles en corres- 
pondance les uns avec les autres. 

7. Systeme selon Tune quelconque des revendications 
precedentes, dans lequel le dictionnaire personnel 
(124a) est forme en stockant egalement au moins 
un des identificateurs de dictionnaires de reconnais- 
sance indiquant des domaines de reconnaissance 
de la pluralite de types de dictionnaires de recon- 
naissance, et les mots de reconnaissance cibles. 

8. Systeme selon Tune quelconque des revendications 
precedentes, dans lequel les donnees de parole 
(124b) sont des donnees obtenues en codant ces 
donnees de parole. 

9. Procede de commande d'un systeme client-serveur 
de reconnaissance de la parole pour la reconnais- 
sance par un serveur (200) de la parole fournie en 
entree sur un client (100), comprenant : 

une etape d'entree de parole consistant afournir 
de la parole en entree ; et 
une etape de transmission consistant a trans- 
mettre au serveur des donnees de parole (1 24b) 
fournies en entree lors de I'etape d'entree de 
parole, des informations de gestion de diction- 
naires (124c) utilisees pour determiner un do- 
maine de reconnaissance d'un dictionnaire de 
reconnaissance utilise pour reconnaitre les don- 
nees de parole, et un dictionnaire personnel 
(124a) conserve sur le client (1 00) qui est forme 
en enregistrant des mots de reconnaissance ci- 
bles designes par un utilisateur ; 
une etape de determination consistant a deter- 
miner un ou plusieurs diction naire(s) de recon- 
naissance (225) correspondant aux informa- 
tions de gestion de dictionnaires (124c) recues 
du client (100) a partir d'une pluralite de types 
de dictionnaires de reconnaissance (225) con- 
serves sur le serveur (200), qui sont prepares 
pour des domaines de reconnaissance respec- 
tifs, et le dictionnaire personnel (124a) recu du 
client (100) ; et 

une etape de reconnaissance consistant a re- 
connaitre les donnees de parole (124b) en uti- 
lisant au moins le dictionnaire de reconnaissan- 
ce (225) determine lors de I'etape de determi- 
nation. 
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1 0. Precede selon la revendication 9, dans lequel I'etape 
de reconnaissance comprend une etape consistant 
a reconnaTtre les donnees de parole (124b) en utili- 
sant le dictionnaire de reconnaissance (225) deter- 
mine lors de I'etape de determination, et le diction- 5 
naire personnel (124a) recu du client (100). 

1 1 . Precede selon la revendication 9 ou 1 0, dans lequel 
I'etape d'entree de parole comprend une etape d'af- 
fichage consistant a afficher une forme d'entree en 10 
tant qu'entree de parole cible, et dans lequel les in- 
formations de gestion de dictionnaires (124c) sont 

un identificateur de forme d'entree qui indique un 
type de forme d'entree. 

15 

12. Procede selon I'une quelconque des revendi cations 
9 a 11, dans lequel les informations de gestion de 
dictionnaires (124c) contiennentdes informations in- 
diquant si le dictionnaire personnel (124a) doit etre 
utilise dans la reconnaissance des donnees de pa- 20 
role (124b). 

13. Procede selon I'une quelconque des revendications 
9 a 12, dans lequel le dictionnaire personnel (124a) 

est forme en stockant des prononciations et des no- 25 
tations des mots de reconnaissance cibles en cor- 18. 
respondance les uns avec les autres. 

14. Procede selon la revendication 11, dans lequel le 
dictionnaire personnel (1 24a) est forme en stockant 30 
egalement au moins un identificateur de forme d'en- 
tree et les mots de reconnaissance cibles en corres- 
pondance les uns avec les autres. 

15. Procede selon I'une quelconque des revendications 35 
9 a 14, dans lequel le dictionnaire personnel (124a) 

est forme en stockant egalement au moins Tun des 
identificateurs de dictionnaires de reconnaissance 
indiquant des domaines de reconnaissance de la 
pluralite de types de dictionnaires de reconnaissan- 40 
ce, et les mots de reconnaissance cibles. 

16. Procede selon I'une quelconque des revendications 
9 a 15, dans lequel les donnees de parole (124b) 
sont des donnees obtenues en codant ces donnees 45 
de parole. 

17. Memoire lisible par ordinateur stockant un code de 
programme de commande d'un systeme client-ser- 
veur de reconnaissance de la parole pour la recon- 50 
naissance par un serveur de la parole fournie en 
entree sur un client, comprenant : 

un code de programme d'une etape d'entree de 
parole de la parole d'entree ; 55 
un code de programme d'une etape de trans- 
mission consistant a transmettre au serveur 
(200) des donnees de parole (124b)fournies en 19. 



entree lors de I'etape d'entree de parole, des 
informations de gestion de dictionnaires (124c) 
utilisees pour determiner un domaine de recon- 
naissance d'un dictionnaire de reconnaissance 
utilise pour reconnaTtre les donnees de parole, 
et un dictionnaire personnel (1 24a) conserve sur 
le client (1 00), qui est forme en enregistrant des 
mots de reconnaissance cibles designes par 
I'utilisateur ; 

un code de programme d'une etape de determi- 
nation consistant a determiner un ou plusieurs 
dictionnaire(s) de reconnaissance (225) corres- 
pondant aux informations de gestion de diction- 
naires (124c) recues du client (100) en prove- 
nance d'une pluralite de types de dictionnaires 
de reconnaissance (225) conserves sur le ser- 
veur (200), qui sont prepares pour des domaines 
de reconnaissance respectifs, et le dictionnaire 
personnel (124a) recu du client (100) ; et 
un code de programme d'une etape de recon- 
naissance consistant a reconnaTtre des don- 
nees de parole (124b) en utilisant au moins le 
dictionnaire de reconnaissance (225) determine 
lors de I'etape de determination. 

Serveur de reconnaissance de la parole (200) pour 
reconnaitre de la parole fournie en entree sur un 
client (100) etenvoyerun resultatde reconnaissance 
au client (100), comprenant : 

un moyen de reception pour recevoir du client 
(100) des donnees de parole (124b), des infor- 
mations de gestion de dictionnaires (124c) uti- 
lisees pour determiner un domaine de recon- 
naissance d'un dictionnaire de reconnaissance 
utilise pour reconnaTtre les donnees de parole, 
etun dictionnaire personnel (124a) forme en en- 
registrant des mots de reconnaissance cibles 
designes par un utilisateur ; 
un moyen de conservation de dictionnaires de 
reconnaissance pour conserver une pluralite de 
types de dictionnaires de reconnaissance (225) 
prepares pour des domaines de reconnaissan- 
ce respectifs ; 

un moyen de determination (223) pour determi- 
ner unou plusieurs diction naire(s) de reconnais- 
sance (225) correspondant aux informations de 
gestion de dictionnaires (124c) recues du client 
(1 00) a partir de la pluralite de types de diction- 
naires de reconnaissance (225) et du diction- 
naire personnel (124a) recu du client (100) ; et 
un moyen de reconnaissance (224) pour recon- 
naTtre les donnees de parole en utilisant au 
moins le dictionnaire de reconnaissance (225) 
determine par ladite etape de determination 
(223). 

Serveur selon la revendication 18, dans lequel ledit 
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moyen de reconnaissance (224) a pourfonction de 
reconnaTtre les donnees de parole (1 24b) en utilisant 
le dictionnaire de reconnaissance (225) determine 
par ledit moyen de determination (223), et le diction- 
naire personnel (124a) recu du client (100). 

20. Serveur selon la revendication 1 8 ou 1 9, dans lequel 
les donnees de parole (124b) sont des donnees ob- 
tenues en codant ces donnees de parole. 

21. Client de reconnaissance de la parole (100) pour 
envoyer de la parole d'entree devant etre reconnue 
a un serveur (200), et pour recevoir un resultat de 
reconnaissance de cette parole, comprenant : 

un moyen d'entree de parole (121, 123) pour 
fournir en entree de la parole ; 
un moyen de conservation de dictionnaire per- 
sonnel pourconserver un dictionnaire personnel 
(124a) forme en enregistrant des mots de re- 
connaissance cibles designes par un 
utilisateur ; et 

un moyen de transmission (122) pourtransmet- 
tre au serveur (200) des donnees de parole 
(124b) fournies en entree par ledit moyen d'en- 
tree de parole, des informations de gestion de 
dictionnaires (124c) utilisees pourdeterminerun 
domaine de reconnaissance d'un dictionnaire 
de reconnaissance utilise pour reconnaTtre les 
donnees de parole, et le dictionnaire personnel 
(124a). 

22. Client selon la revendication 21, dans lequel ledit 
moyen d'entree de parole (121, 123) comprend un 
moyen d'affichage (123) pour afficher une forme 
d'entree en tant qu'entree de parole cible, et dans 
lequel les informations de gestion de dictionnaires 
(124c) sont un identificateur de forme d'entree qui 
indique un type de forme d'entree. 

23. Client selon la revendication 21 ou 22, dans lequel 
les informations de gestion de dictionnaires (124c) 
contiennent des informations indiquant si le diction- 
naire personnel (124a) doit etre utilise dans la re- 
connaissance des donnees de parole. 

24. Client selon I'une quelconque des revendications 21 
a 23, dans lequel le dictionnaire d'utilisateur (124a) 
est forme en stockant des prononciations et des no- 
tations des mots de reconnaissance cibles en cor- 
respondance les uns avec les autres. 

25. Client selon la revendication 22, dans lequel le dic- 
tionnaire personnel (124a) est forme en stockant 
egalement au moins un identificateur de forme d'en- 
tree et les mots de reconnaissance cibles en corres- 
pondance les uns avec les autres. 



26. Clientselon I'une quelconque des revendications 21 
a 25, dans lequel le dictionnaire personnel (124a) 
est forme en stockant egalement au moins I'un des 
identificateurs de dictionnaires de reconnaissance 

5 indiquant des domaines de reconnaissance de la 
pluralite de types de dictionnaires de reconnaissan- 
ce, et les mots de reconnaissance cibles. 

27. Clientselon I'une quelconque des revendications 21 
10 a 25, dans lequel les donnees de parole (1 24b) sont 

des donnees obtenues en codant ces donnees de 
parole. 

28. Procede de commande d'un serveur de reconnais- 
15 sance de la parole (200) pour reconnaTtre de la pa- 
role fournie en entree sur un client (1 00), et envoyer 
un resultat de reconnaissance au client (100), 
comprenant : 

20 une etape de reception consistant a recevoir du 

client des donnees de parole (124b), des infor- 
mations de gestion de dictionnaires (124c) uti- 
lisees pour determiner un domaine de recon- 
naissance d'un dictionnaire de reconnaissance 
25 utilise pour reconnaTtre les donnees de parole, 

etun dictionnaire personnel (124a) forme en en- 
registrant des mots de reconnaissance cibles 
designes par un utilisateur ; 
une etape de determination consistant a deter- 
so miner un ou plusieurs dictionnaires de recon- 
naissance (225) correspondant aux informa- 
tions de gestion de dictionnaires (124c) recues 
du client (100) a partir d'une pluralite de types 
de dictionnaires de reconnaissance (225) con- 
35 serves sur le serveur (200), qui sont prepares 
pour des domaines de reconnaissance respec- 
tifs, et du dictionnaire personnel (124a) recu du 
client (100) ; et 

une etape de reconnaissance consistant a re- 
40 connaTtre les donnees de parole (124b) en uti- 

lisant au moins le dictionnaire de reconnaissan- 
ce (225) determine lors de I'etape de determi- 
nation. 

45 29. Procede selon la revendication 28, dans lequel I'eta- 
pe de reconnaissance comprend une etape consis- 
tant a reconnaTtre les donnees de parole (124b) en 
utilisant le dictionnaire de reconnaissance (225) de- 
termine lors de I'etape de determination, et le dic- 
50 tionnaire personnel (124a) recu du client (100). 

30. Procede selon la revendication 28 ou 29, dans lequel 
les donnees de parole (124b) sont des donnees ob- 
tenues en codant ces donnees de parole. 

55 

31 . Procede de commande d'un client de reconnaissan- 
ce de la parole (1 00) pour envoyer de la parole d'en- 
tree devant etre reconnue a un serveur (200) et re- 
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cevoir un resultat de reconnaissance de cette parole, 
comprenant : 

une etape d'entree de parole consistant afournir 
en entree de la parole ; et 5 
une etape de transmission consistant a trans- 
mettre au serveur (200) des donnees de parole 
(124b)fourniesen entree lorsde I'etape d'entree 
de parole, des informations de gestion de dic- 
tionnaires (124c) utilisees pour determiner un 10 
domaine de reconnaissance d'un dictionnaire 
de reconnaissance utilise pour reconnaitre les 
donnees de parole, et un dictionnaire personnel 
(1 24a) conserve sur le client (1 00), qui est forme 
en enregistrant des mots de reconnaissance ci- is 
bles designes par un utilisateur. 

32. Precede selon la revendication 31 , dans lequel I'eta- 
pe d'entree de parole comprend une etape d'afficha- 

ge consistant a afficher une forme d'entree en tant 20 
qu'entree de parole cible, et dans lequel les informa- 
tions de gestion de diction n aires (124c)sontun iden- 
tificateur de forme d'entree qui indique un type de 
forme d'entree. 

25 

33. Procede selon la revendication 31 ou 32, dans lequel 
les informations de gestion de diction naires (124c) 
contiennent des informations indiquant si le diction- 
naire personnel (124a) doit etre utilise dans la re- 
connaissance des donnees de parole (124b). 30 



naissance de la parole (200) pour la reconnaissance 
de la parole fournie en entree sur un client (1 00) et 
pour I'envoi d'un resultatde reconnaissance au client 
(100), comprenant : 

u n code de programme d'une etape de reception 
consistant a recevoir du client (100) des don- 
nees de parole (124b), des informations de ges- 
tion de dictionnaires (1 24c) utilisees pour deter- 
miner un domaine de reconnaissance d'un dic- 
tionnaire de reconnaissance utilise pour recon- 
naitre les donnees de parole, et un dictionnaire 
personnel (124a) forme en enregistrant des 
mots de reconnaissance cibles designes par un 
utilisateur ; 

un code de programme d'une etape de determi- 
nation consistant a determiner un ou plusieurs 
dictionnaire(s) de reconnaissance (225) corres- 
pondant aux informations de gestion de diction- 
naires (124c) recues du client (100) a partir 
d'une pluralite de types de dictionnaires de re- 
connaissance (225) conserves sur le serveur 
(200), qui sont prepares pour des domaines de 
reconnaissance respectifs, et du dictionnaire 
personnel (124a) regu du client (100) ; et 
un code de programme d'une etape de recon- 
naissance consistant a reconnaitre les donnees 
de parole (1 24b) en utilisant au moins le diction- 
naire de reconnaissance (225) determine lors 
de I'etape de determination. 



34. Procede selon I'une quelconque des revendications 
31 a 33, dans lequel le dictionnaire personnel (124a) 
est forme en stockant des prononciations et des no- 
tations des mots de reconnaissance cibles en cor- 35 
respondance les uns avec les autres. 

35. Procede selon la revendication 32, dans lequel le 
dictionnaire personnel (124a) est forme en stockant 
egalement au moins un identificateur de forme d'en- 40 
tree et les mots de reconnaissance cibles en corres- 
pondence les uns avec les autres. 

36. Procede selon I'une quelconque des revendications 

31 a 35, dans lequel le dictionnaire personnel (124a) 45 
est forme en stockant egalement au moins I'un des 
identificateurs de dictionnaires de reconnaissance 
indiquant des domaines de reconnaissance de la 
pluralite de types de dictionnaires de reconnaissan- 
ce, et les mots de reconnaissance cibles. 50 

37. Procede selon I'une quelconque des revendications 
31 a 36, dans lequel les donnees de parole (124b) 
sont des donnees obtenues en codant ces donnees 

de parole. 55 

38. Memoire lisible par ordinateur qui stocke un code de 
programme de commande d'un serveur de recon- 



39. Memoire lisible par ordinateur qui stocke un code de 
programme de commande d'un client de reconnais- 
sance de la parole (1 00) pour envoyer a un serveur 
(200) de la parole d'entree devant etre reconnue, et 
recevoir un resultat de reconnaissance de cette pa- 
role, comprenant : 

un code de programme d'une etape d'entree de 
parole consistant a fournir en entree de la 
parole ; et 

un code de programme d'une etape de trans- 
mission consistant a transmettre au serveur 
(200) des donnees de parole (1 24b) fournies en 
entree lors de I'etape d'entree de parole, des 
informations de gestion de dictionnaires (124c) 
utilisees pour determiner un domaine de recon- 
naissance d'un dictionnaire de reconnaissance 
utilise pour reconnaitre les donnees de parole, 
et un dictionnaire personnel (1 24a) conserve sur 
le serveur (100), qui est forme en enregistrant 
des mots de reconnaissance cibles, designes 
par un utilisateur. 

40. Produit contenant des instructions pouvant etre mi- 
ses en oeuvre sur un processeur et ayant pour effet 
qu'un dispositif informatique programmable execute 
toutes les etapes du procede selon I'une quelconque 
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des revendications 28 a 37 lorsque le produit a base 
d'instructions est execute sur ledit dispositif informa- 
tique programmable. 
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